Casos Falsos Perfiles en Instagram



Programa de Ciencia de Datos

Departamento de Matemáticas

Universidad Externado de Colombia

Problema

En este ejemplo queremos mostrarles un modelo para identificar perfiles falsos en Instagram

Porqué es importante:

Usando el proceso de análisis

Proceso

Usaremos la base de datos del censo para crear una pantalla de datos que resuma el contenido de la base y nos permita tener una mejor visualización.

Las etapas son:

Acá se puede observar la base de datos original. Observe atentamente los nombres y valores.

Seguramente podrá ver que es muy difícil hacerse una idea de la utilidad que tiene esta base de datos.

Lo primero que vamos a hacer es generar un reporte de gráficos que me permita conocer un poco más acerca de las variables y sus relaciones.

Problematica

Esta base de datos contiene la información histórica de las cuentas de Instagram

Uno de los problemas usuales es la cantidad de cuentas falsas que aparecen constantemente.

Con la siguiente información, se intentará predecir si una cuenta es falsa o no.

Alguna variables son:

Exploración de Datos

Lo primero que se debe hacer, es observar como se relacionan las variables y como se pueden organizar.

A continuación usted vera dos formas de crear reportes. La primera la puede observar haciendo click aqui

La segunda se puede observar sobre este documento. El objetivo de estos reportes es observar que hay en la base de datos de forma resumida e interactiva.

Datos

El siguiente gráficose organiza de la siguiente forma:

Creación del modelo

Lo primero que se debe tener en cuenta es que este es un modelo de clasificación

El objetivo es crear un modelo para predecir más adelante si una cuenta puede ser o no falsa.

Análisis del modelo

Este se análisis se realizará considerando el camino de si la cuenta es falsa.

Intenta hacer el mismo ejercicio combinando los demás resultados del árbol.

Si no sabes cómo, puedes preguntarle a algún asesor para que te ayude a entender mejor el modelo.

Si fueras el gerente de Instagram, ¿qué decisiones podrías tomar con esta información?.